Was ist chi quadrat test?

Chi-Quadrat-Test

Der Chi-Quadrat-Test (auch χ²-Test genannt) ist ein statistischer Hypothesentest, der verwendet wird, um zu bestimmen, ob ein signifikanter Unterschied zwischen den erwarteten und den beobachteten Häufigkeiten in einer oder mehreren Kategorien besteht. Er wird oft verwendet, um die Güte der Anpassung eines theoretischen Modells an beobachtete Daten zu prüfen oder um die Unabhängigkeit zwischen zwei kategorialen Variablen zu untersuchen.

Anwendungsbereiche:

  • Güte der Anpassung (Goodness-of-Fit): Testet, ob eine Stichprobenverteilung zu einer behaupteten Populationsverteilung passt. (Güte der Anpassung Test)
  • Unabhängigkeitstest: Testet, ob zwei kategoriale Variablen in einer Stichprobe voneinander unabhängig sind. (Unabhängigkeitstest)
  • Homogenitätstest: Testet, ob verschiedene Populationen die gleiche Verteilung einer kategorialen Variable haben. (Homogenitätstest)

Voraussetzungen:

  • Die Daten müssen kategorial sein.
  • Die Beobachtungen müssen unabhängig voneinander sein.
  • Die erwarteten Häufigkeiten in jeder Kategorie müssen ausreichend groß sein (in der Regel mindestens 5).

Hypothesen:

  • Nullhypothese (H0): Es gibt keinen signifikanten Unterschied zwischen den erwarteten und beobachteten Häufigkeiten (oder die Variablen sind unabhängig).
  • Alternativhypothese (H1): Es gibt einen signifikanten Unterschied zwischen den erwarteten und beobachteten Häufigkeiten (oder die Variablen sind abhängig).

Berechnung der Chi-Quadrat-Statistik:

Die Chi-Quadrat-Statistik wird wie folgt berechnet:

χ² = Σ [(O - E)² / E]

Wobei:

  • O = Beobachtete Häufigkeit
  • E = Erwartete Häufigkeit
  • Σ = Summe über alle Kategorien

Freiheitsgrade (df):

Die Freiheitsgrade hängen von der Art des Tests ab:

  • Güte der Anpassung: df = Anzahl der Kategorien - Anzahl der geschätzten Parameter - 1
  • Unabhängigkeitstest/Homogenitätstest: df = (Anzahl der Zeilen - 1) * (Anzahl der Spalten - 1)

Interpretation:

Nach der Berechnung der Chi-Quadrat-Statistik und der Bestimmung der Freiheitsgrade wird ein p-Wert ermittelt. Der p-Wert gibt die Wahrscheinlichkeit an, dass die beobachteten Daten (oder extremere Daten) auftreten, wenn die Nullhypothese wahr ist.

  • p-Wert ≤ Signifikanzniveau (α): Die Nullhypothese wird verworfen. Es gibt einen statistisch signifikanten Unterschied zwischen den erwarteten und beobachteten Häufigkeiten.
  • p-Wert > Signifikanzniveau (α): Die Nullhypothese wird nicht verworfen. Es gibt keinen statistisch signifikanten Unterschied zwischen den erwarteten und beobachteten Häufigkeiten.

Wichtige Überlegungen:

  • Der Chi-Quadrat-Test ist empfindlich gegenüber Stichprobengröße. Große Stichproben können zu statistisch signifikanten Ergebnissen führen, auch wenn der Unterschied in der Praxis gering ist.
  • Der Chi-Quadrat-Test ist ein Test auf Assoziation oder Unterschied, nicht auf Kausalität. Ein signifikanter Chi-Quadrat-Test bedeutet nicht, dass eine Variable die andere verursacht.
  • Alternative Tests wie der Fisher-Test können für kleine Stichprobengrößen oder wenn die Voraussetzungen für den Chi-Quadrat-Test nicht erfüllt sind, geeigneter sein. (Fisher-Test)